实例教程:样本量计算之横断面调查+分类变量
医咖会之前推送了三篇样本量计算的文章,很多小伙伴直呼不过瘾。今天上映“样本量计算包教包会”第四集:结局指标是分类变量的横断面调查,该咋计算样本量呢?
小咖:计算结局指标是分类变量的横断面调查所需要的样本量时,首先要给出置信度(Confidence Level),一般可选取置信度1-α=0.95。
此外,还需要根据既往文献或预试验的结果,给定两个参数:①总体比例(高血压病患病率)的估计值;②总体比例(高血压病患病率)估计值的容许误差。
小咖:容许误差表示的是总体比例(北京市40岁及以上人群的高血压病患病率)与样本比例 (样本人群的高血压病患病率)的绝对差值不超过该值。容许误差的确定,取决于你对结果精确性的要求,容许误差越小,样本量越大。一般可尝试性地选取总体比例估计值的0.1倍、0.2倍等。比如你可以取30%的0.1倍,即容许误差为3%。
我总结一下你的问题:研究者拟开展一项横断面调查,调查北京市40岁及以上人群的高血压病患病率。根据其它地区同类调查的结果,估计该年龄段人群中的高血压病患病率为30%。规定允许误差为3%,置信度1-α=0.95,则至少应该调查多少人?
小咖:这总结能力就是家里人教的^_^
好了,接下来我们看看PASS 11软件怎么计算。
1、选择Proportions→One Proportion→Confidence Interval→Confidence Interval for One Proportion
2、Find (Solve for)中选择N(Sample), Confidence Level (1-Alpha)中选择0.95,Confidence Interval Width (Two-Sided)中填入0.06,P (Proportion)中填入0.3。其它选择为默认选项后,点击RUN。
敲黑板!注意啦:Confidence Interval Width (Two-Sided)是指可信区间的宽度,即可信区间的下限到上限的值,而容许误差是可信区间一半的宽度。本研究的容许误差为3%,则可信区间的宽度为6%(即两倍的容许误差),因此在Confidence Interval Width (Two-Sided)中选择0.06。
3、结果解读
PASS软件给出了样本量计算的结果、参考文献、报告中的名词定义和总结性描述。在样本量计算结果中我们需要关注以下一列:
Sample Size (N):样本量。本研究需要928例研究对象。
本研究为横断面调查,目的是调查北京市40岁及以上人群的高血压病患病率。根据其它地区同类调查的结果,该年龄段人群中高血压病患病率大约为30%。规定容许误差为3%,置信度1-α=0.95,利用PASS 11软件计算得到需要调查的样本量N=928例。假定研究对象的无应答率为10%,则需样本量N=928÷0.9=1031例。假定问卷合格率为90%,则共需样本量为N =1031÷0.9=1146例。
小咖:看你写的这么好,我再送你一张图,你感受一下。
样本量计算包教包会精彩回顾:
1. 手把手教你计算样本量
小伙伴们建了一个微信群~~~有临床研究设计或统计学方面的难题?快加小咖个人微信(xys2016ykf),拉你进群,和其他小伙伴们一起交流学习吧。
点击左下角“阅读原文”,了解更多医咖会既往推送的内容。